iT邦幫忙

2019 iT 邦幫忙鐵人賽

DAY 23
0
AI & Data

30天 python 學習心得分享系列 第 23

Day23- 資料處理模組-Pandas 介紹

  • 分享至 

  • xImage
  •  

第一個在鐵人賽度過的生日~~哈哈哈
相信付出的學習時間會有收穫的時候!!讓我們進入今日的主題吧!

在處理資料分析上當然少不了已完善的強大功能模組,Pandas便是其中之一.


Pandas介紹

Pandas是python的一個數據分析模組,2009 年底開源出來,提供高效能、簡易使用的資料格式(Data Frame)讓使用者可以快速操作及分析資料,Pandas強化了資料處理的方便性也能與處理網頁資料與資料庫資料等,有點類似於Office的Excel能更加方便的進行運算、分析等.

安裝

使用Anaconda一樣參照day3於環境中添加Pandas模組,預設是沒有安裝的,安裝完畢後就能引用模組到程式中,大部分都會將Pandas另外命名成pd方便使用,如下範例:

import pandas as pd

Pandas資料結構

Pandas提供以下三種資料結構供使用:

  1. Series:用來處理時間序列相關的資料(如感測器資料等),主要為建立索引的一維陣列。
  2. DataFrame:用來處理結構化(Table like)的資料,有列索引與欄標籤的二維資料集,例如關聯式資料庫、CSV 等等。
  3. Panel:用來處理有資料及索引、列索引與欄標籤的三維資料集(除了特殊需求之外少使用… 略過)。

主要針對較為常使用的Series、DataFrame 進行介紹

Series 欄位

Series基本上是能將一維度的資料加上索引值,這索引值不局限於0、1、2、3數值形式,也能增加日期、文字索引,並能透過索引方式進行資料切片,也可使用函數對值進行運算.

DataFrame 表格

DataFrame用來處理結構化(Table like)的資料,有列索引與欄標籤的二維資料集,可以透過Dictionary或是 Array來建立,就像是Excel一樣具備欄與列的概念可形成完整表格形式,也可以利用外部的資料來讀取後來建立,像是資料表資料或csv檔案等.

以上,是Pandas基本認知,下篇文章我們將針對常用的Series進行學習,

參考文章:https://medium.com/@yehjames/%E8%B3%87%E6%96%99%E5%88%86%E6%9E%90-%E6%A9%9F%E5%99%A8%E5%AD%B8%E7%BF%92-%E7%AC%AC2-3%E8%AC%9B-pandas-%E5%9F%BA%E6%9C%ACfunction%E4%BB%8B%E7%B4%B9-series-dataframe-selection-grouping-447a3fa90b60
參考文章:https://oranwind.org/python-pandas-ji-chu-jiao-xue/

文章內容如果有錯誤歡迎留言告知,可以幫忙糾正錯誤的觀念,感謝!


上一篇
Day22- Python X MySql 2
下一篇
Day24- 資料處理模組-Pandas-Series 基礎
系列文
30天 python 學習心得分享30
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言